home *** CD-ROM | disk | FTP | other *** search
/ Aminet 2 / Aminet AMIGA CDROM (1994)(Walnut Creek)[Feb 1994][W.O. 44790-1].iso / Aminet / util / gnu / diff_2_3.lha / diff-2.3 / cmp.c < prev    next >
C/C++ Source or Header  |  1993-05-26  |  13KB  |  549 lines

  1. /* cmp -- compare two files.
  2.    Copyright (C) 1990, 1991, 1992 Free Software Foundation, Inc.
  3.  
  4.    This program is free software; you can redistribute it and/or modify
  5.    it under the terms of the GNU General Public License as published by
  6.    the Free Software Foundation; either version 2, or (at your option)
  7.    any later version.
  8.  
  9.    This program is distributed in the hope that it will be useful,
  10.    but WITHOUT ANY WARRANTY; without even the implied warranty of
  11.    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  12.    GNU General Public License for more details.
  13.  
  14.    You should have received a copy of the GNU General Public License
  15.    along with this program; if not, write to the Free Software
  16.    Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.  */
  17.  
  18. /* Written by Torbjorn Granlund and David MacKenzie. */
  19.  
  20. #include <stdio.h>
  21. #include "system.h"
  22. #include "getopt.h"
  23.  
  24. char *xmalloc ();
  25. int block_compare ();
  26. int block_compare_and_count ();
  27. int block_read ();
  28. int cmp ();
  29. void printc ();
  30. void error ();
  31. #ifdef AMIGA
  32. void fake_stat_result ();
  33. #endif /* AMIGA */
  34.  
  35. /* Name under which this program was invoked.  */
  36. char *program_name;
  37.  
  38. /* Filenames of the compared files.  */
  39. char *file1;
  40. char *file2;
  41.  
  42. /* File descriptors of the files.  */
  43. int file1_desc;
  44. int file2_desc;
  45.  
  46. /* Read buffers for the files.  */
  47. char *buf1;
  48. char *buf2;
  49.  
  50. /* Optimal block size for the files.  */
  51. int buf_size;
  52.  
  53. /* Output format:
  54.    type_first_diff
  55.      to print the offset and line number of the first differing bytes
  56.    type_all_diffs
  57.      to print the (decimal) offsets and (octal) values of all differing bytes
  58.    type_status
  59.      to only return an exit status indicating whether the files differ */
  60. enum
  61.   {
  62.     type_first_diff, type_all_diffs, type_status
  63.   } comparison_type = type_first_diff;
  64.  
  65. /* If nonzero, print values of bytes quoted like cat -t does. */
  66. int opt_print_chars = 0;
  67.  
  68. struct option long_options[] =
  69. {
  70.   {"print-chars", 0, NULL, 'c'},
  71.   {"verbose", 0, NULL, 'l'},
  72.   {"silent", 0, NULL, 's'},
  73.   {"quiet", 0, NULL, 's'},
  74.   {NULL, 0, NULL, 0}
  75. };
  76.  
  77. void
  78. usage (reason)
  79.      char *reason;
  80. {
  81.   if (reason != NULL)
  82.     fprintf (stderr, "%s: %s\n", program_name, reason);
  83.  
  84.   fprintf (stderr, "\
  85. Usage: %s [-cls] [--print-chars] [--verbose] [--silent] [--quiet]\n\
  86.        from-file [to-file]\n", program_name);
  87.  
  88.   exit (2);
  89. }
  90.  
  91. int
  92. main (argc, argv)
  93.      int argc;
  94.      char *argv[];
  95. {
  96.   int c, opened = 0, exit_status;
  97.   struct stat stat_buf1, stat_buf2;
  98.  
  99.   program_name = argv[0];
  100.  
  101.   /* If an argument is omitted, default to the standard input.  */
  102.  
  103.   file1 = "-";
  104.   file2 = "-";
  105.   file1_desc = 0;
  106.   file2_desc = 0;
  107.  
  108.   /* Parse command line options.  */
  109.  
  110.   while ((c = getopt_long (argc, argv, "cls", long_options, (int *) 0)) != EOF)
  111.     switch (c)
  112.       {
  113.       case 'c':
  114.     opt_print_chars = 1;
  115.     break;
  116.  
  117.       case 'l':
  118.     comparison_type = type_all_diffs;
  119.     break;
  120.  
  121.       case 's':
  122.     comparison_type = type_status;
  123.     break;
  124.  
  125.       default:
  126.     usage ((char *) 0);
  127.       }
  128.  
  129.   if (optind < argc)
  130.     file1 = argv[optind++];
  131.  
  132.   if (optind < argc)
  133.     file2 = argv[optind++];
  134.  
  135.   if (optind < argc)
  136.     usage ("extra arguments");
  137.  
  138.   if (strcmp (file1, "-"))
  139.     {
  140.       opened = 1;
  141.       file1_desc = open (file1, O_RDONLY);
  142.       if (file1_desc < 0)
  143.     {
  144.       if (comparison_type == type_status)
  145.         exit (2);
  146.       else
  147.         error (2, errno, "%s", file1);
  148.     }
  149.     }
  150.  
  151.   if (strcmp (file2, "-"))
  152.     {
  153.       opened = 1;
  154.       file2_desc = open (file2, O_RDONLY);
  155.       if (file2_desc < 0)
  156.     {
  157.       if (comparison_type == type_status)
  158.         exit (2);
  159.       else
  160.         error (2, errno, "%s", file2);
  161.     }
  162.     }
  163.  
  164.   if (file1_desc == file2_desc)
  165.     {
  166.       if (opened)
  167.     error (2, 0, "standard input is closed");
  168.       else
  169.     usage ("at least one filename should be specified");
  170.     }
  171.  
  172. #ifndef AMIGA
  173.   if (fstat (file1_desc, &stat_buf1) < 0)
  174.     error (2, errno, "%s", file1);
  175.   if (fstat (file2_desc, &stat_buf2) < 0)
  176.     error (2, errno, "%s", file2);
  177. #else /* AMIGA */
  178.   if (file1_desc != 0)
  179.     if (fstat (file1_desc, &stat_buf1) < 0)
  180.       error (2, errno, "%s", file1);
  181.   else
  182.     fake_stat_result (&stat_buf1);
  183.   if (file2_desc != 0)
  184.     if (fstat (file2_desc, &stat_buf2) < 0)
  185.       error (2, errno, "%s", file2);
  186.   else
  187.     fake_stat_result (&stat_buf2);
  188. #endif /* AMIGA */
  189.  
  190.   /* If both the input descriptors are associated with plain files,
  191.      we can make the job simpler in some cases.  */
  192.  
  193.   if (S_ISREG (stat_buf1.st_mode) && S_ISREG (stat_buf2.st_mode))
  194.     {
  195.       /* Find out if the files are links to the same inode, and therefore
  196.      identical.  */
  197.  
  198.       if (stat_buf1.st_dev == stat_buf2.st_dev
  199.       && stat_buf1.st_ino == stat_buf2.st_ino)
  200.     exit (0);
  201.  
  202.       /* If output is redirected to "/dev/null", we may assume `-s'.  */
  203.  
  204. #ifndef AMIGA
  205.       if (comparison_type != type_status)
  206.     {
  207.       struct stat sb;
  208.       dev_t nulldev;
  209.       ino_t nullino;
  210.  
  211.       if (stat ("/dev/null", &sb) == 0)
  212.         {
  213.           nulldev = sb.st_dev;
  214.           nullino = sb.st_ino;
  215.           if (fstat (1, &sb) == 0
  216.           && sb.st_dev == nulldev && sb.st_ino == nullino)
  217.         comparison_type = type_status;
  218.         }
  219.     }
  220. #endif /* AMIGA */
  221.  
  222.       /* If only a return code is needed, conclude that
  223.      the files differ if they have different sizes.  */
  224.  
  225.       if (comparison_type == type_status
  226.       && stat_buf1.st_size != stat_buf2.st_size)
  227.     exit (1);
  228.     }
  229.  
  230.   /* Get the optimal block size of the files.  */
  231.  
  232.   buf_size = 8 * 1024;        /* Keep it simple.  */
  233.  
  234.   /* Allocate buffers, with space for sentinels at the end.  */
  235.  
  236.   buf1 = xmalloc (buf_size + sizeof (long));
  237.   buf2 = xmalloc (buf_size + sizeof (long));
  238.  
  239.   exit_status = cmp ();
  240.  
  241.   if (close (file1_desc) < 0)
  242.     error (2, errno, "%s", file1);
  243.   if (close (file2_desc) < 0)
  244.     error (2, errno, "%s", file2);
  245.   if (comparison_type != type_status
  246.       && (ferror (stdout) || fclose (stdout) == EOF))
  247.     error (2, errno, "write error");
  248.   exit (exit_status);
  249.   return exit_status;
  250. }
  251.  
  252. /* Compare the two files already open on `file1_desc' and `file2_desc',
  253.    using `buf1' and `buf2'.
  254.    Return 0 if identical, 1 if different, >1 if error. */
  255.  
  256. int
  257. cmp ()
  258. {
  259.   long line_number = 1;        /* Line number (1...) of first difference. */
  260.   long char_number = 1;        /* Offset (1...) in files of 1st difference. */
  261.   int read1, read2;        /* Number of bytes read from each file. */
  262.   int first_diff;        /* Offset (0...) in buffers of 1st diff. */
  263.   int smaller;            /* The lesser of `read1' and `read2'. */
  264.   int ret = 0;
  265.  
  266.   do
  267.     {
  268.       read1 = block_read (file1_desc, buf1, buf_size);
  269.       if (read1 < 0)
  270.     error (2, errno, "%s", file1);
  271.       read2 = block_read (file2_desc, buf2, buf_size);
  272.       if (read2 < 0)
  273.     error (2, errno, "%s", file2);
  274.  
  275.       /* Insert sentinels for the block compare.  */
  276.  
  277.       buf1[read1] = ~buf2[read1];
  278.       buf2[read2] = ~buf1[read2];
  279.  
  280.       if (comparison_type == type_first_diff)
  281.     {
  282.       int cnt;
  283.  
  284.       /* If the line number should be written for differing files,
  285.          compare the blocks and count the number of newlines
  286.          simultaneously.  */
  287.       first_diff = block_compare_and_count (&cnt, buf1, buf2, '\n');
  288.       line_number += cnt;
  289.     }
  290.       else
  291.     {
  292.       first_diff = block_compare (buf1, buf2);
  293.     }
  294.  
  295.       if (comparison_type != type_all_diffs)
  296.     char_number += first_diff;
  297.       else
  298.     smaller = min (read1, read2);
  299.  
  300.       if (first_diff < read1 && first_diff < read2)
  301.     {
  302.       switch (comparison_type)
  303.         {
  304.         case type_first_diff:
  305.           /* This format is a proposed POSIX standard.  */
  306.           printf ("%s %s differ: char %ld, line %ld",
  307.               file1, file2, char_number, line_number);
  308.           if (opt_print_chars)
  309.         {
  310.           printf (" is");
  311.           printf (" %3o ",
  312.               (unsigned) (unsigned char) buf1[first_diff]);
  313.           printc (stdout, 0,
  314.               (unsigned) (unsigned char) buf1[first_diff]);
  315.           printf (" %3o ",
  316.               (unsigned) (unsigned char) buf2[first_diff]);
  317.           printc (stdout, 0,
  318.               (unsigned) (unsigned char) buf2[first_diff]);
  319.         }
  320.           putchar ('\n');
  321.           /* Fall through. */
  322.         case type_status:
  323.           return 1;
  324.         case type_all_diffs:
  325.           while (first_diff < smaller)
  326.         {
  327.           if (buf1[first_diff] != buf2[first_diff])
  328.             {
  329.               if (opt_print_chars)
  330.             {
  331.               printf ("%6ld", first_diff + char_number);
  332.               printf (" %3o ",
  333.                   (unsigned) (unsigned char) buf1[first_diff]);
  334.               printc (stdout, 4,
  335.                   (unsigned) (unsigned char) buf1[first_diff]);
  336.               printf (" %3o ",
  337.                   (unsigned) (unsigned char) buf2[first_diff]);
  338.               printc (stdout, 0,
  339.                   (unsigned) (unsigned char) buf2[first_diff]);
  340.               putchar ('\n');
  341.             }
  342.               else
  343.             /* This format is a proposed POSIX standard. */
  344.             printf ("%6ld %3o %3o\n",
  345.                 first_diff + char_number,
  346.                 (unsigned) (unsigned char) buf1[first_diff],
  347.                 (unsigned) (unsigned char) buf2[first_diff]);
  348.             }
  349.           first_diff++;
  350.         }
  351.           ret = 1;
  352.           break;
  353.         }
  354.     }
  355.  
  356.       if (comparison_type == type_all_diffs)
  357.     char_number += smaller;
  358.  
  359.       if (read1 != read2)
  360.     {
  361.       switch (comparison_type)
  362.         {
  363.         case type_first_diff:
  364.         case type_all_diffs:
  365.           /* This format is a proposed POSIX standard. */
  366.           fprintf (stderr, "%s: EOF on %s\n",
  367.               program_name, read1 < read2 ? file1 : file2);
  368.           break;
  369.         case type_status:
  370.           break;
  371.         }
  372.       return 1;
  373.     }
  374.     }
  375.   while (read1);
  376.   return ret;
  377. }
  378.  
  379. /* Compare two blocks of memory P1 and P2 until they differ,
  380.    and count the number of occurences of the character C in the common
  381.    part of P1 and P2.
  382.    Assumes that P1 and P2 are aligned at long addresses!
  383.    If the blocks are not guaranteed to be different, put sentinels at the ends
  384.    of the blocks before calling this function.
  385.  
  386.    Return the offset of the first byte that differs.
  387.    Place the count at the address pointed to by COUNT.  */
  388.  
  389. int
  390. block_compare_and_count (count, p1, p2, c)
  391.      int *count;
  392.      char *p1, *p2;
  393.      unsigned char c;
  394. {
  395.   long w;            /* Word for counting C. */
  396.   long i1, i2;            /* One word from each buffer to compare. */
  397.   long *p1i, *p2i;        /* Pointers into each buffer. */
  398.   char *p1c, *p2c;        /* Pointers for finding exact address. */
  399.   unsigned int cnt = 0;        /* Number of occurrences of C. */
  400.   long cccc;            /* C, four times. */
  401.   long m0, m1, m2, m3;        /* Bitmasks for counting C. */
  402.  
  403.   cccc = ((long) c << 24) | ((long) c << 16) | ((long) c << 8) | ((long) c);
  404.  
  405.   m0 = 0xff;
  406.   m1 = 0xff00;
  407.   m2 = 0xff0000;
  408.   m3 = 0xff000000;
  409.  
  410.   p1i = (long *) p1;
  411.   p2i = (long *) p2;
  412.  
  413.   /* Find the rough position of the first difference by reading long ints,
  414.      not bytes.  */
  415.  
  416.   i1 = *p1i++;
  417.   i2 = *p2i++;
  418.   while (i1 == i2)
  419.     {
  420.       w = i1 ^ cccc;
  421.       cnt += (w & m0) == 0;
  422.       cnt += (w & m1) == 0;
  423.       cnt += (w & m2) == 0;
  424.       cnt += (w & m3) == 0;
  425.       i1 = *p1i++;
  426.       i2 = *p2i++;
  427.     }
  428.  
  429.   /* Find out the exact differing position (endianess independant).  */
  430.  
  431.   p1c = (char *) (p1i - 1);
  432.   p2c = (char *) (p2i - 1);
  433.   while (*p1c == *p2c)
  434.     {
  435.       cnt += c == *p1c;
  436.       p1c++;
  437.       p2c++;
  438.     }
  439.  
  440.   *count = cnt;
  441.   return p1c - p1;
  442. }
  443.  
  444. /* Compare two blocks of memory P1 and P2 until they differ.
  445.    Assumes that P1 and P2 are aligned at long addresses!
  446.    If the blocks are not guaranteed to be different, put sentinels at the ends
  447.    of the blocks before calling this function.
  448.  
  449.    Return the offset of the first byte that differs.  */
  450.  
  451. int
  452. block_compare (p1, p2)
  453.      char *p1, *p2;
  454. {
  455.   long *i1, *i2;
  456.   char *c1, *c2;
  457.  
  458.   /* Find the rough position of the first difference by reading long ints,
  459.      not bytes.  */
  460.  
  461.   for (i1 = (long *) p1, i2 = (long *) p2; *i1++ == *i2++;)
  462.     ;
  463.  
  464.   /* Find out the exact differing position (endianess independant).  */
  465.  
  466.   for (c1 = (char *) (i1 - 1), c2 = (char *) (i2 - 1); *c1 == *c2; c1++, c2++)
  467.     ;
  468.  
  469.   return c1 - p1;
  470. }
  471.  
  472. /* Read NCHARS bytes from descriptor FD into BUF.
  473.    Return the number of characters successfully read.  */
  474.  
  475. int
  476. block_read (fd, buf, nchars)
  477.      int fd;
  478.      char *buf;
  479.      int nchars;
  480. {
  481.   char *bp = buf;
  482.   int nread;
  483.  
  484.   for (;;)
  485.     {
  486.       nread = read (fd, bp, nchars);
  487.       if (nread < 0)
  488.     return -1;
  489.       bp += nread;
  490.       if (nread == nchars || nread == 0)
  491.     break;
  492.       nchars -= nread;
  493.     }
  494.   return bp - buf;
  495. }
  496.  
  497. /* Print character C on stream FS, making nonvisible characters
  498.    visible by quoting like cat -t does.
  499.    Pad with spaces on the right to WIDTH characters.  */
  500.  
  501. void
  502. printc (fs, width, c)
  503.      FILE *fs;
  504.      int width;
  505.      unsigned c;
  506. {
  507.   if (c >= 128)
  508.     {
  509.       putc ('M', fs);
  510.       putc ('-', fs);
  511.       c -= 128;
  512.       width -= 2;
  513.     }
  514.   if (c < 32)
  515.     {
  516.       putc ('^', fs);
  517.       c += 64;
  518.       --width;
  519.     }
  520.   else if (c == 127)
  521.     {
  522.       putc ('^', fs);
  523.       c = '?';
  524.       --width;
  525.     }
  526.  
  527.   putc (c, fs);
  528.   while (--width > 0)
  529.     putc (' ', fs);
  530. }
  531.  
  532. #ifdef AMIGA
  533. void fake_stat_result (sbuf)
  534.      struct stat *sbuf;
  535. {
  536.   time_t cur_time;
  537.  
  538.   time (&cur_time);
  539.   sbuf->st_dev = 0;
  540.   sbuf->st_ino = 0;
  541.   sbuf->st_mode = S_IREAD;
  542.   sbuf->st_nlink = 1;
  543.   sbuf->st_uid = 0;
  544.   sbuf->st_gid = 0;
  545.   sbuf->st_size = 0;
  546.   sbuf->st_ctime = sbuf->st_atime = sbuf->st_mtime = cur_time;
  547. }
  548. #endif /* AMIGA */
  549.